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Aus der US 5,317,646 geht ein Verfahren hervor, das einen Be- 
diener beira Erzeugen von elektronischen Vorlagen fur ein For- 
mularerkennungs system unterstutzt. Hierzu wird ein nicht mit 
Daten versehenes Formular, ein sogenanntes Master-Formular , 
5 an einem Bildschirm dargestellt und der Benu-tzer kann die Da- 
tenf elder mit einer Zeigereinrichtung kennzeichnen . Die Koor- 
dinaten, die den entsprechenden Bereich begrenzen, werden au- 
tomatisch erfasst, nachdem ein einziger Punkt innerhalb die- 
ses Bereiches vom Bediener ausgewahlt worden ist. Mit diesem 
10 Verfahren konnen schnell und einfach Vorlagen fur die automa- 
tische Formularerkennung erstellt werden. 

In Casey R.G. et al . , „ Intelligent Forms Processing'', IBM Sy- 
stems Journal vol. 29 (1990) Nr. 3, Seiten 435 bis 450 wird 

15 ein Formularerkennungsverf ahren beschrieben, bei dem ein ein- 
gescanntes Formular mittels Bildverarbeitungstechniken analy- 
siert und mit anderen gespeicherten Vorlagef ormularen vergli- 
chen wird. Falls keine Ubereinstimmung mit einem Vorlagef or- 
mular gefunden wird, muss ein neues Vorlagef ormular durch 

20 Eingabe am Computer erzeugt werden. Beim Erzeugen einer Vor- 
lage wird das gescannte Formular am Bildschirm dargestellt 
und mit einer Zeigereinrichtung werden die Begrenzungslinien 
der Eingabef elder markiert. 

25 Aus der US 2002/141660 Al geht ein zweistufiges Verfahren 
hervor, bei welchem zunachst Formularvorlagen eingegeben wer- 
den konnen . und danach anhand der eingegebenen Formularvorla- 
gen Dokumente automatisch ausgelesen werden konnen, Einzuge- 
bende Formularvorlagen werden gescannt und der Bediener zeigt 

3 0 mit einem Cursor auf Eingabef elder . Die Position und GroSe 
der Eingabef elder wird gespeichert . Der Bediener kann auch 
den jedem Datenfeld zugeordneten Datentyp bestimmen. Beim au- 
tomatischen Lesen von Formularen werden diese eingescannt und 
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anhand der in den gespeicherten Formularvorlagen enthaltenen 
Datenfeldern automatisch ausgelesen. Falls beim Auslesen ein 
Fehler auftritt, kann der Bediener tiber die Tastatur den Feh- 
ler korrigieren. 

Die US 6,028,970 betrifft ein Verfahren und ein System zur 
automatischen Texterkennung (OCR) . Das System umf asst ein 
Fehlerkorrigiermodul {„error correction logic module"). Die- 
ses Fehlerkorrigiermodul wird auf klar erkennbare Datenfehler 
angewandt, um diese zu korrigieren. Diese Korrekturen werden 
automatisch ausgefuhrt. Hierbei werden nicht nur Fehler ein- 
zelner Buchstaben erkannt, sondern auch Fehler im Kontext 
analysiert und entsprechend korrigiert. Ein nicht automatisch 
korrigierbarer Fehler kann dem Bediener mittels einer Fehler- 
nachricht mitgeteilt werden. Der Bediener kann dann den mit- 
tels der Texterkennung erzeugten Text beurteilen und gegebe- 
nenfalls korrigieren. 
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Anspriiche 

1. Verfahren zum Erfassen von Daten aus maschinell lesbaren 
5 Dokumenten, wobei die Daten einer Datenbank zugeordnet 

warden, indem einzelne Daten moglichst automatisch dem 
Dokument extrahiert werden und in entsprechende Daten- 
bankfelder eingetragen werden, und falls Daten fiir ein 
Oder mehrere bestiirante Da tenbankf elder einem Dokument 
10 nicht mit der notwendigen Zuverlassigkeit extrahiert wer- 

den konnten, werden folgende Schritte ausgef iihrt : 
) - Darstellen des Dokumentes an einem Bildschirm, 

- Anzeigen des Datenbankf eldes , fiir das die Daten nicht 
mit der notwendigen Zuverlassigkeit extrahiert werden 

15 konnten, am Bildschirm, 

- Ausfiihren einer Vorschlags-Routine , mit welcher 
Stringabschnitte in der Nahe eines von einem Benutzer 
auf dem Bildschirm bewegbaren Zeiger ausgewahlt, mar- 
kiert und zur Extraktion vorgeschlagen werden. 

20 

2. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

dass der Stringabschnitt nach Mafigabe von dem Datenbank- 
feld zugeordneten Konzept-Inf ormationen ausgewahlt, mar- 
25 kiert und zur Extraktion vorgeschlagen wird. 

3. Verfahren nach Anspruch 2, 
dadurch gekennzeichnet, 

dass die Konzept-Inf ormationen die Syntax und/oder die 
3 0 Semantik des Datenbankf eldes beschreiben, so dass von der 

Vorschlags -Routine ein zu markierender Stringabschnitt 
entsprechend der Syntax bzw. der Semantik des jeweiligen 
Datenbankf eldes ausgewahlt und markiert wird. 

35 
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4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

dass die Inf onnationen zur Syntax die Anzahl von Ziffern 
und/oder Buchstaben und/oder vorbestimmte Formate des zu 
5 lesenden Stringabschnitts beschreiben. 

5 . Verfahren nach Anspruch 3 oder 4 , 
dadurch gekennzeichn e*t, 

dass die Inf onnationen zur Semantik vorbestimmte Begrif- 
10 fe, bspw. mit einem Lexikon, beschreiben. 

6. Verfahren nach einem der Anspriiche 1 bis 5, 
dadurch gekennzeichnet, 

dass ein Stringabschnitt ausgewahlt wird, der zwischen 
15 zwei Begrenzungszeichen angeordnet ist. 

7. Verfahren nach Anspruch 6,, 
dadurch gekennzeichnet, 

dass Begrenzungszeichen Leerzeichen und/oder Satzzeichen 
2 0 -umfassen. 

8. Verfahren nach einem der Anspriiche 1 bis 7, 
dadurch gekennzeichnet, 

dass der Text von Dokumenten in grafischer Darstellung 

2 5 zunachst mit einem OCR-Verf ahren in codierten Text umge- 

setzt wird und die Vorschlags-Routine zusatzlich zum mar- 
kierten Stringabschnitt in grafischer Darstellung den co- 
dierten Text dieses Stringabschnittes darstellt. 

3 0 9. Verfahren nach einem der Anspriiche 1 bis 7, 

dadurch gekennzeichnet, 
dass zusatzlich zum markierten Stringabschnitt dieser 
Stringabschnitt nochmals in vergroiSerter Darstellung am 
Bildschirm angezeigt wird. 

35 
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10. Verfahren nach einem der Ansprliche 1 bis 9, 
dadurch gekennzeichnet, 

dass die Vorschlags -Routine nach dem Markieren eines 
Stringabschnittes eine Funktion aktiviert, mit welcher 
5 durch Betatigen einer oder mehrerer vorbestimmter Tasten 

der Inhalt des markierten Stringabschnittes in die Daten- 
bank ubernommen wird. 

11. Verfahren nach einem der Anspriiche 1 bis 10, 
10 dadurch gekennzeichnet, 

dass beim Ausfiihren der Vorschlags-Routine nach dem Bewe- 
gen des Zeigers ein vorbestimmtes Zeitintervall abgewar- 
tet wird, innerhalb dessen der Zeiger nicht bewegt werden 
darf, bevor ein Stringabschnitt ausgewahlt wird. 

15 

12 . Verfahren zum Erf assen von Daten aus maschinell lesbaren 
Dokumenten, wobei die Daten einer Datenbank zugeordnet 
werden, insbesondere nach einem der Anspriiche 1-11, 
dadurch gekennzeichnet, 

20 dass nach dem Einlesen von Daten aus einer ersten Tabel- 

lenzeile in korrespondierende Datenbankf elder automatisch 
die weiteren Tabelleneintrage durch einen Vergleich von 
unterhalb der ersten Tabellenzeile angeordneten Stringab- 
schnitten mit den Stringabschnitten der ersten Tabellen- 

2 5 zeile, die den eingelesenen Daten entsprechen, ermittelt 

werden und diese weiteren Tabelleneintrage automatisch 
extrahiert werden. 

13. Verfahren nach Anspruch 12, 

30 dadurch gekennzeichnet, 

dass der Vergleich zwischen den Stringabschnitten mittels 
eines String Matching-Verf ahrens erfolgt. 

14 . Verfahren nach Anspruch 12 oder 13 , 

35 dadurch gekennzeichnet, 

dass die ermittelten Tabelleneintrage markiert werden. 
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15. Verfahren nach Anspruch 14, 
dadurch gekennzeichnet, 

dass Funktionen zum Editieren der markierten Tabellenein- 
trage bereitgestellt werden. 

5 

16. System zum Erfassen von Daten aus maschinell lesbaren Do- 
kumenten umfassend einen Computer (12) mit einer Spei- 
chereinrichtung (13) und eine CPU (14) , wobei in der 
Speichereinrichtung (13) ein Sof twareprodukt zum Ausfuh- 

10 ren des Verfahrens nach einem der Anspruche 1-15 ge- 

speichert ist. 

) 

17. System nach Anspruch 16, 

dadurch gekennzeichnet, 
15 dass das System eine Eingabeeinrichtung (17) in Form ei- 

ner Maus (6) und/oder Tastatur (7) aufweist, 

18- System nach Anspruch 16 oder 17, 

dadurch gekennzeichnet, 
20 dass das System einen Scanner (16) zum optischen Abtasten 

von Dokumenten aufweist. 

19. Computerprogrammprodukt, das bei seinem Laden und Ausfuh- 
ren auf einem Computer (12) ein Verfahren nach einem der 
) 25 Anspruche 1 bis 15 bewirkt. 
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